CN. Trần Thị Hoa Phượng – IVF Tâm Anh
1. Giới thiệu
Việc cá nhân hóa liều hormone kích thích nang trứng (FSH) trong quá trình kích thích buồng trứng có kiểm soát (COS) là rất quan trọng để tối ưu hóa kết quả trong hỗ trợ sinh sản, nhưng vẫn còn khó khăn do sự đa dạng của bệnh nhân. Hầu hết các mô hình hiện có chỉ giới hạn ở việc dự đoán tĩnh liều ban đầu và không hỗ trợ điều chỉnh theo thời gian thực trong suốt quá trình kích thích.
Trong số các phác đồ khác nhau, phác đồ dài sử dụng chất chủ vận GnRH (GnRH-agonist long protocol) đã được chứng minh có liên quan đến chất lượng noãn và tỷ lệ thai lâm sàng tích lũy cao hơn. Phác đồ này sử dụng chất chủ vận GnRH để ngăn chặn sự tăng LH sớm và đảm bảo kích thích buồng trứng có kiểm soát, sau đó sử dụng FSH để tạo ra nhiều nang trứng. Việc định liều FSH chính xác là nền tảng cho sự thành công của COH. Cả việc dùng quá liều và thiếu liều đều tiềm ẩn rủi ro đáng kể: quá liều FSH có thể gây hội chứng quá kích buồng trứng (OHSS) và làm giảm chất lượng noãn, trong khi thiếu liều có thể dẫn đến phát triển nang trứng kém và phải hủy chu kỳ. Các phương pháp định liều FSH hiện tại phần lớn vẫn mang tính chủ quan, khác biệt đáng kể giữa các bác sĩ lâm sàng, cơ sở y tế và quốc gia, dẫn đến kết quả không tối ưu, tăng chi phí và biến chứng.
Nghiên cứu của Kong và cộng sự (2025) đã cho thấy sự ra đời của Hồ sơ Y tế Điện tử (EHR) đã tạo cơ hội mới để phát triển các cách tiếp cận tinh vi hơn trong tối ưu hóa điều trị, đặc biệt kết hợp mô hình mã hóa chung theo thời gian và tính năng chéo (Cross-Temporal and Cross-Feature Joint Encoding - CTFE) giúp tích hợp cả dữ liệu theo dõi thời gian và các đặc điểm bệnh nhân bất biến theo thời gian để đưa ra khuyến nghị định liều FSH cá nhân hóa.
2. Vật liệu và phương pháp
Dữ liệu của nghiên cứu này được thu thập từ phân tích hồi cứu của 45.257 chu kỳ điều trị từ Trung tâm Y học Sinh sản của Bệnh viện Tháp Chuông Nam Kinh (Reproductive Medicine Center of Nanjing Drum Tower Hospital) từ tháng 1 năm 2018 đến tháng 12 năm 2020. Trong số này, 18.832 chu kỳ sử dụng phác đồ dài GnRHa (IVF/ICSI). Cuối cùng, 13.788 bệnh nhân được đưa vào nghiên cứu với số lượng nang noãn ban đầu (antral follicle count - AFC) từ 7 đến 30. Dữ liệu được chia ngẫu nhiên thành các training (n = 6.761), validation (n = 2.898) và test (n = 4.135). Một chu kỳ điều trị thành công được định nghĩa là đạt được 6–20 nang trứng có đường kính ≥ 14 mm vào ngày tiêm hCG kích thích rụng trứng.
Tập dữ liệu ban đầu bao gồm 274 biến, bao gồm:
-
Các đặc điểm cơ bản của bệnh nhân (chiều cao, cân nặng, tuổi).
-
Tiền sử sinh sản (vô sinh nguyên phát hoặc thứ phát, kết quả IVF trước đây, thời gian vô sinh).
-
Các dấu hiệu dự trữ buồng trứng (AMH, mức FSH, LH, estradiol và progesterone cơ bản vào ngày 2-3 của chu kỳ).
-
Số lượng nang noãn ban đầu (AFC).
-
Các phép đo hormone hàng ngày (estradiol, progesterone, LH, FSH) trong suốt chu kỳ điều trị.
-
Dữ liệu theo dõi nang trứng hàng ngày bao gồm 13 đặc điểm chính, được chuyển đổi thành 52 thuộc tính phát hiện nang trứng hàng ngày để phân tích.
Trong quá trình xử lý dữ liệu, các biến có dữ liệu thiếu quá mức - excessive missing data (> 60%) đã bị loại trừ. Các biến phân loại được chuyển đổi bằng cách mã hóa one-hot. Các dữ liệu thiếu cho các đặc điểm tĩnh liên tục được điền bằng cách sử dụng phương pháp thay thế giá trị trung bình (mean imputation), trong khi các biến phân loại tĩnh được đặt là 'None' trước khi mã hóa one-hot. Đối với dữ liệu theo dõi động, các giá trị thiếu được điền bằng giá trị của lần quan sát trước đó (forward fill) để duy trì tính liên tục theo thời gian. Ngoài ra, tất cả các biến liên tục đã được chuẩn hóa bằng phương pháp min-max scaling.
Mô hình CTFE được đề xuất bao gồm ba thành phần chính: bộ mã hóa dữ liệu chuỗi thời gian, bộ mã hóa chung dữ liệu bất biến theo thời gian và cổng hợp nhất. Mô hình này sử dụng D-TDNN (Deep Time Delay Neural Network) để xử lý dữ liệu chuỗi thời gian. Mô hình cũng sử dụng phương pháp trích xuất trọng số tính năng để thu thập các phép đo thống kê (trung bình, phương sai, độ nhọn và độ xiên) từ dữ liệu chuỗi thời gian.
-
Dữ liệu bệnh nhân được biểu diễn dưới dạng hai thành phần riêng biệt: Ti (thông tin sinh lý cơ bản như tuổi, cân nặng) và Ts (thông tin theo dõi hàng ngày theo chuỗi thời gian như FSH, LH, E2, P, kích thước nang trứng).
-
Hai mạng D-TDNN (DTDNN_1 và DTDNN_2) được sử dụng: DTDNN_1 để trích xuất mối quan hệ theo thời gian và tính năng chéo giữa thông tin sinh lý cơ bản và thông tin theo dõi hàng ngày; DTDNN_2 để trích xuất các tính năng theo thời gian từ dữ liệu.
-
Một cơ chế hợp nhất mới (AddGate) được triển khai để tích hợp thông tin theo dõi thời gian và thông tin sinh lý cơ bản, giải quyết các sai lệch quan trọng ảnh hưởng đến các mẫu thời gian.
Trong giai đoạn dự đoán, nghiên cứu sử dụng chiến lược truy xuất K-nearest neighbor (KNN) dựa trên tương tự Cosine (Cosine-Similarity-KNN) để tìm kiếm các chu kỳ COS bệnh nhân tương đồng nhất. Các liều FSH hàng ngày được phân loại thành các nhóm: dừng, liều thấp (< 80), liều trung bình-thấp (80 ~ 160), liều trung bình-cao (160 ~ 240) và liều cao (> 240). Kết quả dự đoán là nhóm liều lượng mục tiêu.
Hệ thống hỗ trợ ra quyết định lâm sàng thời gian thực để dự đoán liều FSH đã được triển khai. Hệ thống này bao gồm ba thành phần chính: thu thập dữ liệu, tiền xử lý và tạo dự đoán. Hệ thống cung cấp ba kết quả chính cho bác sĩ lâm sàng: khuyến nghị liều lượng dự đoán bởi KNN, tỷ lệ lựa chọn cho mỗi liều lượng được đề xuất và tỷ lệ thành công dự kiến tương ứng.
3. Kết quả
Mô hình CTFE (Cross-Temporal and Cross-Feature Encoding) đã đạt được độ chính xác phân loại liều là 0,737 (± 0,004) và điểm F1-weighted là 0,732 (± 0,005) trên tập kiểm tra.
Trong so sánh với các phương pháp truyền thống như mô hình hồi quy LASSO, mô hình CTFE đã thể hiện hiệu suất vượt trội đáng kể trên các ngày kích thích quan trọng:
-
Vào Ngày 1, mô hình CTFE đạt điểm F1 là 0,832 so với 0,699 của mô hình LASSO (p < 0,001).
-
Vào Ngày 5, mô hình CTFE đạt điểm F1 là 0,817 so với 0,523 của mô hình LASSO (p < 0,001).
Điều này cho thấy sự cải thiện đáng kể của CTFE so với các phương pháp thông thường.
Phân tích hiệu suất của các cấu trúc mô hình khác nhau cho thấy:
-
Mô hình CTFE (AddGate) đề xuất đạt được các chỉ số hiệu suất cao nhất, với độ chính xác 0,7367 (± 0,0043) và điểm F1-weighted 0,7320 (± 0,0048).
-
Việc kết hợp cơ chế AddGate đã nâng cao hơn hiệu suất của mô hình, dẫn đến độ chính xác được cải thiện cho cả DTDNN (0,7301 ± 0,0081) và LSTM (0,7242 ± 0,0046).
Việc triển khai phương pháp sliding window approach đã chứng minh những cải thiện đáng kể trong độ chính xác dự đoán cho các giai đoạn điều trị sau này, đặc biệt khi lượng dữ liệu giảm theo số ngày điều trị. Mặc dù hiệu suất vẫn giữ nguyên cho các ngày 1-12, nhưng những cải thiện rõ rệt đã xuất hiện từ ngày 13 trở đi. Cụ thể:
-
Phương pháp sliding window approach đạt độ chính xác 0,732 vào ngày 16 (cải thiện 4,6%), 0,720 vào ngày 17 (cải thiện 5,6%), và 0,781 vào ngày 18 (cải thiện 11,0%) so với phương pháp tiêu chuẩn.
4. Bàn luận
Mô hình CTFE được đề xuất đã kết hợp độc đáo khả năng điều chỉnh liều FSH theo thời gian thực với dự đoán thời điểm kích thích rụng trứng. Cách tiếp cận toàn diện này đại diện cho một bước tiến đáng kể so với các mô hình hiện có bằng cách cung cấp tối ưu hóa điều trị động, cá nhân hóa trong suốt toàn bộ chu kỳ COS. Mô hình đã nắm bắt thành công mối quan hệ động giữa các đặc điểm sinh lý cơ bản của bệnh nhân và thông tin điều trị theo trình tự, dẫn đến hiệu suất dự đoán liều lượng thuốc vượt trội so với các phương pháp dựa trên hồi quy truyền thống và các phương pháp liên quan đến thời gian. Một thế mạnh của CTFE là khả năng cung cấp đầu ra có thể giải thích được, bao gồm tỷ lệ lựa chọn liều lượng và xác suất thành công, nâng cao tiện ích lâm sàng của nó.
Sự kết hợp này giải quyết hiệu quả một hạn chế phổ biến của các mô hình học sâu hiện có: thách thức trong việc tích hợp dữ liệu theo thời gian và dữ liệu bất biến theo thời gian. Hiệu suất vượt trội của CTFE (độ chính xác: 0,7367 ± 0,0043, F1-weighted: 0,7320 ± 0,0048) so với các mô hình đơn giản hơn chỉ sử dụng dữ liệu thời gian cho thấy giá trị của cách tiếp cận tích hợp này.
Phương pháp sliding window approach giúp tận dụng dữ liệu điều trị theo thời gian, ngay cả khi số bệnh nhân giảm dần. Thay vì chỉ lấy dữ liệu tại một thời điểm, phương pháp này xem xét toàn bộ quá trình điều trị. Nhờ đó, mô hình học được nhiều thông tin hơn và có độ chính xác cao hơn, đặc biệt ở giai đoạn sau. Cách làm này cũng tăng đáng kể lượng dữ liệu đầu vào. Đây là một bước tiến quan trọng trong xây dựng mô hình AI ổn định và hiệu quả.
Mặc dù có những kết quả đầy hứa hẹn, nghiên cứu vẫn có một số hạn chế. Hiệu suất của mô hình có thể bị ảnh hưởng bởi những sai số phát sinh từ sự khác biệt trong các phác đồ điều trị và khuynh hướng cá nhân của bác sĩ. Ngoài ra, phạm vi thời gian (2018–2020) và kích thước của tập dữ liệu có thể hạn chế khả năng khái quát hóa của mô hình. Hơn nữa, nghiên cứu cần có thêm nhiều nghiên cứu đối chứng ngẫu nhiên để tăng tính xác thực.
5. Kết luận
Nghiên cứu này giới thiệu một mô hình học sâu mới sử dụng mã hóa chung theo thời gian và tính năng chéo (CTFE) để tối ưu hóa liều FSH sử dụng trong quá trình kích thích buồng trứng có kiểm soát. Mô hình đã chứng minh hiệu suất mạnh mẽ với độ chính xác 73,7% trong việc dự đoán liều FSH cá nhân hóa, vượt trội đáng kể so với các phương pháp thông thường. Bằng cách tích hợp thành công cả các đặc điểm tĩnh của bệnh nhân và dữ liệu theo dõi động, mô hình của nghiên cứu giải quyết một khoảng trống quan trọng trong các cách tiếp cận quản lý COS hiện tại.
Mặc dù thiết kế hồi cứu, đơn trung tâm có những hạn chế nhất định, hiệu suất mạnh mẽ của mô hình cho thấy tiềm năng của nó như một công cụ hỗ trợ quyết định lâm sàng có giá trị. Nghiên cứu này đại diện cho một bước tiến đáng kể hướng tới chuẩn hóa các phác đồ COS thông qua trí tuệ nhân tạo, có khả năng thúc đẩy y học chính xác cá nhân hóa trong chăm sóc sức khỏe sinh sản và cải thiện kết quả điều trị. Đáng chú ý, với sự cải thiện từ 19% đến 56% so với LASSO vào những ngày điều trị quan trọng, mô hình CTFE chứng tỏ khả năng thích ứng vượt trội với các phản ứng động của bệnh nhân.
Kong, N., Xia, Y., Wang, Z., Zhang, H., Duan, L., Zhu, Y., ... & Sun, H. (2025). Deep learning-based prediction of individualized Real-time FSH doses in GnRH agonist long protocols. Journal of Translational Medicine, 23(1), 1-11.










Tiền Hội nghị: Trung tâm Hội nghị Grand Saigon, thứ bảy ngày ...
New World Saigon hotel, thứ bảy 14 tháng 06 năm 2025 (12:00 - 16:00)
Vinpearl Landmark 81, ngày 9-10 tháng 8 năm 2025

Kính mời quý đồng nghiệp quan tâm đến hỗ trợ sinh sản tham ...

Y học sinh sản số 73 (Quý I . 2025) ra mắt ngày 20 . 3 . 2025 và ...

Sách ra mắt ngày 6 . 1 . 2025 và gửi đến quý hội viên trước ...